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摘要 : 射电 干扰 (radio frequency interference, RFI) 会 导致 与 科学 目标 相关 的 天 文 观测 数据 损 
失 或 质量 下 降 ， 因 此 对 其 进行 检测 与 消除 是 射电 天 文 观测 数据 处 理 的 重要 步 又 之 一 。 低 频 射 电 二 
扰 主 要 来 源 于 人 为 活动 和 自然 大 气 现象 ， 如 调频 广播 、 航 空 通信 、 卫 星 通信 、 流 星 和 闪电 等 。 以 
新 疆 乌 拉 斯 台 的 21CMA (the 21 centimeter array) 单 天 线 阵 的 高 时 间 分 辨 率 ( 约 1 ms) 观测 模 
式 为 基础 开发 出 一 套用 于 低频 射电 干扰 快速 检测 与 分 析 的 算法 软件 。 该 软件 利用 信号 频谱 瀑布 
图 作为 输入 ， 主 要 基于 Canny 边缘 检测 算法 与 Hough 寻 线 算法 来 识别 射电 干扰 信号 。 测 试 结果 
显示 ， 该 软件 对 参数 依赖 性 低 ， 输 出 结果 准确 率 约 在 90%， 处 理性 能 有 望 满足 实时 处 理 的 需要 。 
观测 数据 来 自 2020 年 1 月 象限 仪 流星 雨 期 间 进行 的 约 42 h 的 观测 ， 通 过 射电 干扰 检测 与 初步 分 
析 ， 结 果 显 示 在 74 ~ 110 MHz 频率 范围 内 ， 检 测 到 的 低频 射电 干扰 的 主要 来 源 很 可 能 是 流星 余 
迹 的 反射 信号 
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中 图 分 类 号 : P161 文献 标识 码 : A 
1 引 言 


对 于 低频 射电 望远镜 (工作 频率 低 于 300 MHz) 来 说 ， 人 类 活动 产生 的 无 线 电 、 广 撮 
视 、 调 频 无 线 电 传输 、 航 空 和 卫星 通信 等 信号 都 是 主要 的 干扰 源 呈 。 空 间 大 气 的 一 些 物理 ; 
程 也 会 引入 射电 干扰 ， 比 如 大 气 对 流 层 的 散射 引起 广播 和 电视 信号 的 反射 ”大气 波导 效应 
导致 的 电磁 信号 的 长 距离 传播 ”、 电 离 层 异常 引起 的 低频 无 线 电信 号 的 反射 "、 流 星 余 迹 引 
起 的 散射 只 、 闪 电 马 等。 如 果 把 相应 的 物理 过 程 作为 科学 目标 ， 射 电 干扰 就 可 能 反映 其 物理 
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过 程 信 息 。 

相对 于 天 文 信号 而 言 ， 射 电 干扰 信号 往往 会 强 至 少 10 倍 ”"， 但 持续 时 间 通 常 相对 较 短 。 
以 21CMA 为 例 ， 它 的 最 佳 工作 频段 是 70 ~ 200 MHz， 主 要 科学 目标 是 宇宙 再 电离 信号 的 
探测 。 字 宙 i 再 电离 时 期 中 性 氧 的 信号 强度 在 (1 x 10-3 ~ 0.1) K 的 量 级 ”。 而 我 们 实际 观测 
到 的 信号 中 主导 成 分 是 银河 系 本 身 的 低频 辐射 ， 其 强度 在 100 MHz 左右 为 1100 K, KFE 
再 电离 信号 强 4~ 5 个 数量 级 ， 而 在 这 个 频率 范围 内 的 射电 干扰 通常 会 比 银 河 系 辐射 还 要 
高 2 个 量 级 ”。 因 为 有 着 较为 明显 的 识别 特征 ， 在 数据 量 不 大 的 情况 下 ， 对 数据 中 的 射电 干 
扰 可 以 进行 人 工 标注 。 本 文中 所 使 用 的 21CMA 的 单 天 线 阵 ， 虽 然 同 时 观测 的 只 有 一 到 两 
个 天 线 阵 ， 但 是 由 于 采用 了 较 高 的 时 间 分 辨 率 ( 约 1 ms)， 每 个 天 线 每 秒 能 产生 32 MB 数 
据 ，24 h 观测 将 得 到 2.76 TB 数据 。21CMA 共有 81 个 天 线 阵 ， 如 果 全 部 投入 观测 每 天 生 
成 440 TB 的 数据 。 这 样 的 数据 量 明显 超出 目前 望远镜 后 端 所 能 承载 的 数据 处 理 能 力 。 因 此 
在 本 实验 中 ， 我 们 仅 使 用 两 组 天 线 持 续 观 测 了 总 共 42 h， 得 到 4.6 TB 数据 。 即便 如 此 ， 通 
过 人 工 识 别 这 些 观测 数据 中 的 RFI 也 已 经 是 一 个 低 效 且 不 可 持续 的 方法 。 另 外 人 类 活动 产 
生 的 RFI 信和 号 带宽 相对 较 窗 ， 频 率 固定 ， 有 时 带 有 明显 调制 结构 ， 这 些 特点 有 助 于 我 们 证 
认 低 频 射电 干扰 信号 的 具体 来 源 。 

天 文 界 已 有 的 一 些 射 电 干 扰 识 别 软件 不 完全 适合 目前 的 需求 。 如 VarThreshold， 它 不 
适合 检测 距离 非常 近 、 信 号 非常 尖锐 的 射电 干扰 ”; 基于 奇异 值 分 解 (SVD) 的 算法 ”在 检 
测 周期 性 的 射电 干扰 时 具有 非常 好 的 效果 ， 但 是 难以 检测 随 频 率 变化 的 射电 干扰 信号 ; 
AOFlagger” 是 一 套 基 于 射电 干扰 信号 的 形态 进行 检测 、 标 记 并 去 除 射 电 干扰 的 软件 ， 此 软 
件 在 设计 时 把 检测 与 标注 的 准确 性 作为 一 个 重要 的 考虑 目标 ， 因 此 在 检测 效率 上 有 所 妥协 ， 
AOFlagger 处 理 10° 个 数据 点 需要 1 s 左右 ， 而 我 们 使 用 的 单个 天 线 阵 采样 1 s 约 有 8 x 10° 
个 点 ， 另 外 AOFlagger 不 支持 21CMA 单 天 线 模块 的 数据 模式 。 

本 工作 利用 计算 机 视觉 算法 快速 提取 毫秒 时 间 尺 度 上 射电 干扰 源 ， 整 理 观 测 数据 中 的 
RFI 信号 特征 ， 后 续 可 构建 射电 干扰 源 样本 研究 RFI 产生 物理 机 制 。 本 文 分 为 4 部 分 : 第 1 
章 介 绍 研究 背景 和 意义 ; 第 2 章 介 绍 研究 数据 和 软件 框架 ; 第 3 章 给 出 本 项 工作 的 测试 结 
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果 ; 第 4 章 进行 总 结 和 讨论 。 
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2 数据 和 软件 框架 


2.1 ”数据 

本 工作 使 用 的 数据 来 自 21CMA。21CMA 位 于 新 疆 乌 拉 斯 台 ， 台 址 海拔 2650 m AE, 
四 周 由 海拔 3000 m 以 上 的 群 山 所 环绕 ， 可 以 作为 天 然 屏 障 阻挡 来 自 周 边 地 区 的 电磁 辐射 。 
观测 设备 是 21CMA 中 的 E5 (东边 第 5 组 ) 和 EO (东边 第 9 组) 两 个 单 天 线 阵 ， 时 间 分 辨 率 
是 1 ms， 频 率 范围 是 50 ~ 200 MHz。 观 测 时 间 是 2021 F1H 3 4 5H, PARRER 
计 观 测 时 间 42 hp， 总 数据 量 4.6 TB。 数 据 格式 为 随时 间 变 化 的 瀑布 图 (频谱 图 )， 横 坐标 为 
频率 ， 单 位 是 光 赫 兹 (MHz); 纵 坐 标 是 时 间 ， 单 位 是 毫秒 (ms)。 实 地 测量 表明 ，21CMA 站 
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址 周围 射电 干扰 主要 来 自 低 轨 卫星 数据 传输 (137 MHz)、 民 航 通讯 (121 MHz)， 没 有 持续 的 
调频 广播 的 干扰 ， 是 低频 射电 天 文 观测 的 优良 台 址 ”。 
图 1 展示 了 根据 接收 到 的 信号 得 到 的 频率 随时 间 和 功率 分 布 的 频谱 图 。 
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TE: 图 a) 和 b) 的 上 半 部 分 是 频率 信号 随时 间 变 化 的 瀑布 图 ， 下 半 部 分 黑 线 是 上 半 部 分 时 间 内 功率 平均 后 的 频谱 
分 布 图 。 图 a) 下 半 部 分 小 图 频率 87 ~ 111 MHz 之 间 出 现 了 较 弱 的 射电 干扰 ， 红 线 为 小 图 的 频谱 图 ， 绿 直线 为 
周边 调频 广播 频段 。 


图 1 ”两 个 不 同时 刻 ，E9 天 线 阵 接收 到 的 信号 功率 随时 间 和 频率 分 布 图 


图 1 a) 上 半 部 分 是 人 工 目 视 发 现 的 射电 干扰 信号 ， 相 应 的 RFI 信号 放大 后 显示 在 图 a) 
下 半 部 分 内 部 。 图 1 a) 下 半 部 分 黑 线 是 所 有 2000 ms 信号 功率 的 平均 结果 ， 红 线 是 250 ~ 
500 ms 功率 的 平均 结果 ， 绿 直线 为 地 区 调频 广播 的 频率 (中 央 人 民 广 播 电 台 : 88.7 MHz; 
维 语 台 : 90.6 MHz; 新 疆 人 民 广 播 电台 城市 广播 : 92.9 MHz; 新 疆 人 民 广 播 电 台 交 通 广播 ; 


202306.00380v1 


chinaXiv 


ChinaXiv 合 作 期 刊 


2 期 高 文 帅 ， 等 : 基于 计算 机 视觉 算法 的 低频 射电 干扰 快速 检测 与 分 析 研 究 287 


94.9 MHz; 新 疆 人 民 广 播 电 台新 闻 综 合 : 96.1 MHz; 乌鲁木齐 交通 广播 : 97.4 MHz; 新 闻 
音乐 广播 : 99.0 MHz; 旅游 音乐 广播 : 106.5 MHz)。 这 期 间 频 率 87 ~ 111 MHz 之 间 出 现 了 
较 弱 的 射电 干扰 ， 相 应 的 射电 干扰 信号 放 在 图 a) 下 半 部 分 内 部 ， 发 现 137 MHz 处 有 强 干扰 
a5. Alb) 未 发 现 射电 干扰 信号 ， 黑 线 为 2000 ms 信号 功率 平均 的 结果 ， 这 期 间 频 率 87 
~ 111 MHz 之 间 未 出 现 图 1 a) 中 的 较 弱 射电 干扰 ， 但 发 现 144 MHz 处 有 强 干 扰 信 号 ， 可 能 
来 自 对 讲 机 通信 干扰 。 

图 2 为 人 工 找 到 的 低频 射电 干扰 信号 示例 。 为 了 找到 有 效 检测 射电 干扰 信号 的 方法 ， 我 
们 先 对 30 min 的 观测 数据 进行 了 人 工 目 视 检 测 ， 发 现 大 部 分 数 百 毫秒 或 更 长 的 突 发 射电 干 
扰 信 号 可 能 来 自 飞机 、 流 星 余 迹 或 者 其 他 原因 散射 的 调频 广播 。 这 些 信 号 的 频率 范围 与 调频 
广播 的 范围 一 致 ， 并 且 由 于 调频 广播 是 通过 改变 载 频 的 瞬时 频率 来 传输 信息 ， 所 以 通过 信和 号 
的 频率 抖动 可 以 很 容易 地 把 它们 识别 出 来 。 


98 99 100 101 102 103 104 105 106 107 


TE: 图 中 横 坐 标 为 观测 频率 ， 纵 坐标 分 别 为 功率 和 时 间 。 从 上 半 部 分 图 中 可 见 低频 射电 于 扰 信 号 有 规律 频率 的 载 
频 改 变现 象 ， 因 此 可 以 被 认定 为 被 散射 的 调频 广播 信号 ， 此 信号 持续 时 间 约 300 ms. 


图 2 ”典型 低频 射电 干扰 信号 示例 图 


2.2 ”软件 框架 描述 

通过 人 工 目 视 检测 ， 我 们 发 现 大 多 数 射电 干扰 在 频率 -时 间 图 (频率 信号 随时 间 变 化 的 瀑 
布 图 ) 中 功率 电 平 较 高 ， 因 此 我 们 尝试 利用 计算 机 视觉 识别 中 常用 的 边缘 检测 和 线段 检测 算 
法 来 提取 信号 ， 以 Canny 边缘 检测 算法 ”与 Hough 导线 算法 ”为 核心 算法 进行 射电 干扰 信 
号 检测 。 
第 一 步 ， 主 成 分 分 析 处 理 。 将 频率 信号 随时 间 变 化 的 瀑布 图 (频率 -时 间 图 ) 作为 检测 程 
序 的 输入 数据 ， 对 输入 数据 先 用 主 成 分 分 析 (principal component analysis, PCA)™ 的 方法 
找到 第 一 阶 主 要 成 分 ， 第 一 阶 主 成 分 对 应 的 是 原始 信号 中 的 主要 信号 主导 成 分 ， 其 余 高 阶 主 
成 分 对 应 着 原始 信号 中 的 微 扰 成 分 。 在 本 工作 中 ， 由 于 仪器 噪声 和 环境 温差 等 因素 ， 通 过 人 
工 目 视 相 对 功率 大 小 ， 发 现 输入 数据 中 整体 信号 强度 并 不 稳定 。 射 电 干 扰 在 输入 数据 中 表现 
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为 瞬时 的 微 扰 成 分 ， 而 第 一 主 成 分 对 应 的 是 频谱 信号 在 较 长 时 间 尺 度 上 的 结构 与 变化 。 我 们 
从 原始 输入 信号 中 减 去 第 一 主 成 分 后 的 信号 ， 即 扣除 输入 数据 中 较 长 时 间 尺 度 上 的 功率 起 


伏 ， 处 理 后 的 信号 
整 幅 图 像 进行 加 权 平 均 的 过 程 。 


作为 


表现 为 沿 轴 X 


X 或 轴 


号 中 的 弱 干 扰 


数据 ， 得 到 用 于 提取 射电 干扰 信号 的 有 


类 查找 算法 找到 射电 干扰 信号 参数 ， 


a SET ING. SU. BAA, AA Canny 边缘 检测 和 Hough 寻 线 算法 处 理 


下 一 步 的 输入 。 


效 参 数 。 第 六 步 ， 
按照 时 间 、 


第 二 步 ， 高 斯 滤波 函数 作 平滑 处 理 。 高 斯 滤波 就 是 对 
在 输入 数据 中 
Y 方向 上 一 致 的 梯度 变化 ， 
高 斯 滤波 可 以 有 效 地 抚 平一 些小 的 起 伏 ， 保 留 线段 结构 。 


段 干 扰 信 号 表示 为 条 线段 ， 其 强度 变化 
而 小 的 随机 起 伏 信号 则 是 各 向 同性 的 ， 所 以 
第 三 步 ， 引入 Sobel 算 子 对 输入 信 


通过 FOF (friends of friends 
频率 相关 性 组 合成 事件 通过 统计 


(events). 


https: //github.com/simongibbons/pyfof 


某 一 事件 中 所 有 射电 干扰 信和 号 持续 时 间 ， 可 以 得 到 某 一 射电 干扰 事件 发 生 的 起 止 时 间 、 频 率 
范围 和 相对 强度 。 检 测 程序 的 具体 流程 见 图 芭 
1 个 数据 输入 | at 个 数据 输入 ; 
1 ~20 000 ms | 120 000n ~ 40 O00n ms 
主 成 分 分 析 处 理 | ; 。 主 成 分 分 析 处 理 。 
y LE 
| 高 其 平滑 处 理 |i ae 
y ry 
| Sobel 算 子 处 理 | Sobel fF Mb 
y O 
| Canny 算 法 处 理 | Canny 算 法 处 到 
y A Satan: 
| Hough 算 法 处 理 | Hough 算 法 处 型 
| vy DT 
输出 射电 干扰 事件 结果 
VE: 虚线 流程 代表 同时 输入 多 个 数据 实现 的 多 线程 数据 处 理 。 
3 ”射电 干扰 检测 流程 示意 图 
2.2.1 主 成 分 分 析 处 理 
主 成 分 分 析 通 过 正 交 变换 将 输入 的 信号 进行 线性 变换 ， 从 而 投影 为 一 系列 线性 无 关 成 
分 的 值 ， 这 些 线性 无 关 的 成 分 称 为 主 成 分 。 一 般 来 说 其 中 第 一 主 成 分 对 应 的 是 原始 信号 中 的 
主要 信号 主导 成 分 ， 高 阶 主 成 分 对 应 着 原始 信号 中 的 微 扰 成 分 。 这 一 步 处 理 有 助 于 稳定 后 面 
Canny 边缘 检测 算法 与 Hough 寻 线 算法 中 参数 的 选择 。 数 据 处 理 中 所 用 的 主 成 分 分 析 算 法 
是 基于 奇异 值 分 解 的 方法 (singular value decomposition, SVD)， 我 们 对 天 线 接收 到 的 某 段 
时 间 内 的 频谱 (也 就 是 指定 时 间 长 度 的 瀑布 图 ) 数据 X(t,v) (其 中 te fto, ti) 是 信号 到 达 时 
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Al, BALA ms, v € [50, 200] 是 频率 ， 单 位 为 MHz) 进行 奇异 值 分 解 (如 图 团 所 示 )。 
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YE: a) 显示 的 是 主 成 分 分 析 处 理 前 的 数据 ，b) 显示 的 是 处 理 后 的 结果 。 原 始 数据 中 存在 的 随 频率 变化 的 系统 底 
噪 被 扣除 并 作 归 一 化 处 理 ， 短 时 标的 射电 干扰 信号 仍然 被 保留 了 下 来 。 


图 4 主 成 分 分 析 处 理 效果 示意 图 


2.2.2 高 斯 平滑 滤波 处 理 

高 斯 平滑 滤波 主要 目的 是 抑制 小 尺度 上 随机 出 现 的 假 信 号 。 二 维 的 高 斯 平滑 滤波 器 中 
频率 方向 上 的 平滑 宽度 是 sz = 5 pixel， 时 间 方 向 的 平滑 宽度 是 sy = 21 pixel。 为 了 尽量 检 
测 到 稳定 的 射电 干扰 信号 ， 所 以 在 时 间 方 向 的 平滑 宽度 ， 我 们 设 为 频率 方向 上 的 平滑 宽度 
的 4 倍 。 如 果 需 要 看 更 加 短 时 标的 射电 干扰 ， 则 需要 降低 时 间 方 向 的 平滑 尺度 。 测 量 结果 表 
明 ， 小 幅 变化 两 个 平滑 宽度 对 结果 影响 较 小 。 
2.2.3 Sobel 算 子 处 理 

Sobel 算 子 由 Sobel 和 Feldman 两 人 于 1973 FHT, HEMS Canny 算法 类 似 ， 是 
用 于 边缘 检测 的 微分 算 子 。 通 过 利用 两 个 3 x 3 矩阵 与 输入 图 像 卷 积 ， 得 到 图 像 轴 XS FY 
方向 近似 梯度 。 本 文 利 用 Sobe 算 子 对 图 像 进行 预 处 理 ， 将 原始 瀑布 图 转化 成 信号 变化 梯度 
图 ， 作 为 之 后 Canny 算法 的 输入 。Sobel 算 子 的 作用 是 强化 信号 ， 经 过 Sobel 算 子 预 处 理 后 
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的 图 像 中 射电 干扰 信号 相对 背景 会 更 加 显著 ， 后 续 Canny 算法 处 理 时 对 参数 的 依赖 性 也 
降低 ， 因 而 整体 结果 将 更 加 稳定 (如 图 回 所 示 )。 
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2.2.4 Canny 算法 处 理 
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TE: 蓝 色 半 透明 线 表示 的 是 Hough 算法 最 后 找到 的 射电 干扰 信号 ， 信 号 较为 集中 的 区 域 ( 细 方 框 内 的 区 域 ) 放大 
显示 在 左下 角 红 色 方 框 内 。 


6 Canny 和 Hough 算法 处 理 后 找到 的 射电 干扰 信号 示意 图 


2.26 FOF FARE 

KK TAU ER WH, HP SK BE ZB SE, ZEN Ta Pe EA 
关 性 。 前 面 几 步 的 射电 干扰 处 理 步 又， 只 能 检测 单独 射电 干扰 信号 结构 ， 无 法 处 理 射 电 王 扰 
言 号 在 时 间或 频率 上 的 相关 性 。 因 此 我 们 引入 FOF 的 分 类 搜寻 算法 ， 将 Hough 算法 找到 的 
射电 干扰 信号 的 起 止 时 间 和 发 生 频率 作为 输入 ， 将 时 间 与 频率 都 相关 的 射电 干扰 信号 群 定 
义 为 一 个 事件 ， 最 后 得 到 了 一 系列 的 射电 干扰 事件 。 这 些 事件 及 它们 的 性 质 将 会 被 用 于 后 续 
的 射电 王 扰 信号 相关 物理 过 程 的 研究 。 时 间 相 关 性 可 以 用 FOR 算法 中 的 链接 参数 来 衡量 : 
参数 值 越 大 、 时 间 间 陋 更 远 的 信号 会 被 认为 是 同一 事件 ， 参 数值 越 小 ， 同 一 事件 可 能 被 分 割 
成 两 个 相距 较 近 的 不 同事 件 。 经 过 测量 发 现 = 500 是 一 个 较为 合适 参数 ， 这 个 值 的 上 下 浮 
动 ， 对 最 后 事件 的 总 数 影响 较 小 (参见 3.1 节 )。 
民 据 电脑 处 理性 能 ， 本 工作 把 连续 观测 数据 分 割 成 时 长 为 2 x 104 ms 的 片断 ， 在 每 个 
片断 运行 前 5 步 ， 最 后 通过 FOF 算法 得 到 射电 干扰 事件 集合 。 


3 ”测试 与 结果 


3.1 ”程序 结果 的 稳定 性 

本 射电 干扰 检测 与 分 析 算 法 软件 综合 多 个 算法 ， 每 个 算法 均 有 若干 参数 ， 因 此 需要 选择 
合适 参数 集合 。 我 们 检测 的 主要 目标 是 时 长 为 几 十 至 几 百 毫秒 级 别 的 射电 于 扰 信 号 。 和 希望 
输出 的 结果 满足 两 个 指标 : 第 一 是 尽 可 能 不 漏 掉 射电 干扰 信号 ， 用 找到 的 信号 事件 (q) 占 输 
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ylin 


入 数据 中 所 有 信号 事件 (n) 的 百分比 (q/n) 来 衡量 ， 第 二 是 找到 的 射电 干扰 信号 要 准确 ， 在 
复杂 射电 环境 中 真实 射电 干扰 (找到 的 信号 减 去 虚假 信号 (f) 即 q — f) 信号 占 全 部 找到 信号 
(q) 的 百分比 ， 即 (gq 一 有 )/q。 以 上 两 个 指标 (百分比 ) 越 高 ， 说 明 所 选 的 参数 越 合适 。 针 对 具 
体 的 科学 研究 目标 ， 通 过 微调 参数 集合 对 不 同 强 度 RFI 信 号 进行 提取 。 

首先 ， 我 们 人 工 检查 了 约 0.5 h 的 数据 ， 以 比较 程序 找到 的 射电 干扰 信号 和 人 工 识别 的 
差别 。 经 过 人 工 对 比 确认 ， 发 现 使 用 默认 参数 集合 的 检测 程序 输出 结果 的 准确 率 为 90% 左 
右 。 表 1 中 加 粗 显示 了 目前 的 默认 参数 集 ， 以 此 为 基础 ， 每 次 改变 一 个 重要 参数 ， 然 后 比较 
找到 的 射电 干扰 事件 的 结果 。 结 果 显 示 ， 我 们 的 检测 与 分 析 算 法 软件 输出 比较 稳定 ， 在 不 同 
参数 选择 下 ， 最 终结 果 的 变化 稳定 在 10% 以 内 。 其 中 影响 最 大 的 参数 是 lengthnintine “EC 
决定 了 程序 找到 最 小 信号 的 长 度 ， 其 值 的 增长 会 导致 找到 短 时 标的 射电 干扰 信号 的 数量 下 
降 ， 经 过 仔细 对 比 ， 确 认 lengthmintine 仅 影 响 一 些 暗 弱 的 射电 干扰 事件 。 


表 1 程序 参数 选择 情况 


参数 参数 值 ”事件 事件 变化 幅度 
86 249 4 
valmin 106 239 
124 223 7 
107 228 5 
valmax 125 239 
145 235 2 
10 239 
threshold 20 234 4 
30 228 5 
15 258 8 
lengthmin tine 25 239 
35 214 10 
300 227 5 
b 500 239 
700 234 2 
= 注 : 参数 1，2 Canny 算法 的 参数 ， 参 数 3, 4 是 Hough 算法 所 
WY 的 参数 ， 参 数 5 是 FOF 分 类 处 理 中 的 参数 。 事 件 是 我 们 用 约 前 1000 s 


的 数据 ， 根 据 不 同 参数 分 别 找到 的 信号 事件 数量 。 最 后 一 列 是 取 不 同 参数 
时 相对 默认 事件 的 变化 幅度 。 检 测 与 分 析 框 架 的 默认 参数 为 : valmin = 
106, valmax = 125, threshold = 10, lengthminjine = 25, b = 500. 


目的 是 初步 检测 与 分 析 射 电 干扰 信号 ， 因 此 主要 关注 对 结构 清晰 的 射电 
否 成 功 ， 对 上 暗 弱 射电 干扰 搜寻 的 优化 问题 暂时 没有 考虑 。 


本 工作 的 主要 
干扰 信号 的 检测 是 
3.2 ”程序 性 能 
整套 程序 框架 由 Python 语言 编号， 除了 主 成 分 分 析 处 理 ， 其 他 步 又 都 是 单线 程 工 
作 。 观 测 数据 存储 在 以 10 Gb.s-! 相连 的 网 络 存储 服务 器 上 ， 程 序 运 行 时 数据 读 入 的 
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速度 约 为 1.45 Gb.s-!， 远 没有 达到 10 GB 网 络 带 宽 。 通 过 程序 计时 ， 可 得 前 5 个 步 又 
(PCA、 高 斯 平滑 、Sobel 算 子 处 理 、Canny 算法 处 理 、Hough 算法 处 理 ) 的 耗 时 比例 为 
4.3:0.22:0.25:0.33:0.09。 目 前 检测 程序 处 理 1000 s 的 观测 总 共 需 要 约 472 s， 所 用 时 间 小 于 
观测 数据 本 身 的 时 长 ， 符 合 框架 算法 验证 阶段 目标 ， 可 以 实时 处 理 观测 数据 。 
3.3 ”检测 结果 分 析 

本 节 展 示 程 序 输 出 结果 并 分 析 。 图 7 是 经 过 框架 输出 的 结果 ， 是 射电 干扰 事件 的 典型 例 
子 。 我 们 找到 一 些 持续 时 间 约 数 十 秒 甚至 更 长 的 调频 广播 信号 。 如 图 8 所 示 的 事件 甲 、 乙 、 
两 ， 事 件 甲 和 事件 乙 持 续 的 时 间 约 为 100 ~ 200 ms 左右 ， 同 时 发 现 事 件 甲 在 调频 广播 频段 
信号 频率 才 盖 比 长 时 间 持 续 信号 多 ， 且 存在 于 80 MHz 以 下 频段 ， 事 件 乙 在 调频 广播 频段 信 
号 频率 履 盖 与 长 时 间 持 续 信 号 相近 ， 很 可 能 两 个 事件 发 生 的 地 点 相关 性 比较 高 ， 后 续 可 利用 
这 些 相 关 性 以 及 不 同 天 线 阵 观测 的 时 间 相 关 性 来 确定 事件 发 生 的 空间 位 置 。 
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功率 /任意 单位 


90 95 100 


图 7 经 典 单个 射电 干扰 事件 示例 图 


飞行 器 和 流星 余 迹 都 能 前 向 散射 调频 广播 信号 。 为 了 验证 我 们 所 检测 到 的 射电 干扰 信 
号 是 否 主要 是 由 流星 余 迹 反射 引起 的 ， 我 们 于 2021 年 1 月 3 日 特意 选取 象限 仪 流星 雨 爆发 
期 间 进行 了 观测 ， 统 计 了 测 到 的 射电 干扰 信号 随时 间 变 化 的 结果 (如 图 9 所 示 )。 我 们 发 现 ， 
检测 到 的 射电 干扰 数目 有 周 天 变 化 ， 具 体 表现 为 凌晨 5 时 左右 信号 少 ， 傍 晚 18 时 左右 信号 
多 ， 两 时 段 信号 数量 比 约 为 1:3， 这 与 地 球 大 气 与 流星 体 碰 撞 概率 理论 预测 吻合 “”。 地 球 
上 流星 发 生 的 数目 ， 由 于 地 球 自转 和 公转 的 运动 ， 使 得 一 天 之 中 太阳 升 起 的 时 候 ， 地 面 观测 
到 的 流星 数目 更 多 (流星 与 地 球 白昼 面 迎面 相 碰 )， 傍 晚 时 刻 观 测 到 的 数目 较 少 (只 能 观测 到 
追 上 地 球 的 流星 )””。 相 较 于 其 他 时 间 段 ， 在 1 月 3 日 22 时 开始 至 次 日 凌晨 4 时 期 间 ， 射 
电 干 扰 信 号 的 计数 有 一 个 明显 的 增加 趋势 (参见 图 日 b))， 因 此 ， 观 测 到 的 射电 干扰 信号 事件 
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FE: 在 观测 数据 中 有 少数 持续 时 间 较 长 的 信号 ( 约 60 s), FEE M EEN SS SUPE: 甲 、 乙 、 丙 。 事 
件 甲 和 乙 放大 后 显示 在 图 中 间 和 下 面部 分 。 


图 8 混合 射电 干扰 事件 示例 图 
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可 能 来 自流 星 轨迹 引起 的 调频 广播 前 向 散射 。 
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a) 


VE: a) 42 h 观测 数据 检测 到 的 射电 干扰 事件 计数 随时 间 变 化 图 。 其 中 红色 点 划 线 和 绿色 虚线 是 E5 天 线 分 别 于 
1 月 3 日 和 1 月 4 日 观测 约 12 h 的 结果 ， 黑 实 线 是 E9 天 线 16 h 观测 的 结果 。 淡 紫色 的 阴影 标注 了 2021 F 
限 仪 座 流 星 雨 峰值 的 大 致 时 间 。E5 天 线 因 故 在 1 月 4 日 白天 没有 观测 数据 。b) 展示 的 是 1 月 3 日 晚 与 1 月 4 
晚 的 射电 干扰 事件 计数 按 相 同时 刻 对 齐 后 的 比较 结果 。1 月 3 日 晚 象限 仪 座 流星 雨 发 生 时 ， 射 电 干扰 计数 明显 高 
于 1 月 4 日 晚上 的 E5 和 E9 的 计数 。 


图 9 ”检测 到 的 射电 干扰 信号 数量 随时 间 的 变化 图 


4 总 结 与 讨论 


为 快速 提取 毫秒 时 间 尺 度 上 射频 干扰 源 ， 整 理 观测 数据 中 的 RFI 信号 特征 ， 我 们 开发 
了 一 套 RFI 信和 号 的 快速 检测 与 分 析 算 法 软件 。 软 件 框架 主要 基于 计算 机 视觉 的 Canny 算 
法 、Hough 寻 线 算 法 和 主 成 分 分 析 算 法 ， 最 后 由 了 OF 算法 把 射电 干扰 信号 按时 间 和 频率 的 
相关 性 分 组 。 经 初步 验证 ， 计 算 机 算法 处 理 效率 较 高 ， 软 件 对 参数 选择 的 依赖 性 较 低 ， 检 测 
到 的 REI 一 致 性 较 好 ， 能 够 降低 系统 变化 引起 的 RFI 检 出 数量 的 不 确定 性 ， 满 足 本 工作 初 
步 要 求 。 

本 工作 后 续 可 以 进一步 优化 参数 ， 提 高 暗 弱 射电 信号 检测 能 力 ， 如 用 模拟 信和 号 数据 优化 
参数 ， 把 输出 结果 作为 机 器 学 习 的 输入 数据 ， 引 入 机 器 学 习 提 升 RFI 检测 能 力 。 同 时 ， 参 
考 其 他 射电 干扰 软件 方法 ， 比 较 优 缺点 ， 持 续 提 高 射电 干扰 检测 的 效率 和 准确 度 。 
通过 射电 天 文 望远镜 接收 流星 余 迹 的 反射 来 观测 流星 已 经 是 一 种 较为 成 熟 的 流星 观测 
方法 ， 在 国外 已 经 有 成 熟 的 射电 流星 监测 网 (例如 BRAMS 加 。 与 光学 方法 相 比 ， 射 电 望 远 
镜 的 观测 不 受 光照 的 影响 ， 对 天 气 的 依赖 性 低 ， 且 更 容易 观测 到 上 暗 弱 的 流星 。 对 流星 的 观测 
可 帮助 我 们 研究 彗星 粒子 轨道 的 性 质 ， 也 有 助 于 研究 太阳 系 的 内 部 结构 等 。 本 工作 将 流星 的 
观测 方法 与 之 前 常用 的 射电 观测 流星 的 方法 进行 对 比 ， 不 同 之 处 在 于 ， 我 们 的 观测 不 需要 
发 射 机 发 出 信号 照 亮 流星 余 迹 ， 而 使 用 周边 调频 广播 的 信号 当 作 “发 射 机 ”。 今 后 如 果 有 
个 较为 完备 的 站 址 周边 的 调频 广播 的 信息 库 ， 包 括 发 射频 率 和 位 置 ， 那 么 通过 接收 到 的 反 
射 信号 之 间 的 时 延 ， 可 以 得 到 射电 干扰 事件 的 距离 和 方向 信息 。 除 流星 余 迹 的 反射 ， 对 流 层 
散射 、 大 气 波导 现象 、 零 星 的 电离 层 异 常 、 闪 电 等 大 气 层 内 的 物理 现象 都 会 产生 射电 干扰 信 


° https: //brams.aeronomy.be 
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3, 


时 这 些 信 号 的 功率 会 非常 高 ， 完 全 破坏 低频 射电 阵 所 在 的 安静 电磁 环境 。 记 录 显 示 ， 


2021 年 7 月 ，21CMA 接收 到 大 量 高 强度 的 调频 广播 信号 ， 这 些 干扰 持续 时 间 从 几 小 时 到 半 
天 不 等 ， 晚 上 即 消 失 ， 内 容 包 括 英语 、 俄 语 等 内 容 ， 经 过 持续 排查 ， 基 本 排除 人 为 干扰 可 
能 。 这 种 临时 或 季节 性 的 干扰 很 可 能 与 大 气 波导 现象 有 关 ， 持 续 的 监测 数据 将 非常 有 助 于 研 
究 这 些 干扰 背后 的 物理 机 制 。 
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Abstract: Radio Frequency Interference (RFI) can cause losing or degrading of astronomical 


observational data. Therefore, one of the key step in processing the radio observational data 
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is the detection and mitigation of RFI. The RFI in low frequency radio band not only can be 
introduced by the human activities or natural phenomenon in the atmosphere, such as FM 
broadcasting, aviation communication, satellite communication, meteor, lightning, etc. This 
work designs a pipeline based on computer vision algorithms for detecting and analyzing the 
low frequency RFI received by signal antenna pod of the 21 Centimeter Array. The pipeline, 
with the waterfall of received signals as input, and the pipeline identifies RFI primarily based 
on the canny algorithm and hough algorithm. The test results show that the pipeline is not 
sensitive to the changing of parameter, and the accuracy of the output is about 90%. The 
performance of the pipeline is able to meet the requirement of real-time RFI detection of 
the data. The principle of the method, the performance and the outcome of the pipeline are 
shown in the paper. We test our pipeline on the observation of 42 hours made in Janary of 
2021. By the factor that the number counts of RFI events found by the pipeline varying with 
time and frequency, we infer that the major of the short RFI within the frequency range 
74 ~ 110 MHz are the results of remote FM radio signals forward scattered by the meteor 


trails. 


Key words: radio low-frequency interference; low-frequency radio interferometer; image 


processing; computer vision algorithm 


